سایە حەسەن
توێژەری یاریدەدەر
بەشی پەروەردەی كۆمپیوتەر
زانكۆی نێودەوڵەتیی تیشك - هەولێر
پرۆسێسی زمانی کوردی ئاماژەیە بۆ بەکارهێنانی تەکنیک و تەکنۆلۆژیای پرۆسێسی زمانی سروشتی (NLP) کە بە تایبەتی بۆ زمانی کوردی داڕێژراون NLP. بریتییە لە کارلێکی نێوان کۆمپیوتەر و زمانە (سروشتییەکانی) مرۆڤ. چەندین ئەرکی جۆراوجۆر لەخۆدەگرێت، لەوانە:
شیکاری دەق(Text Analysis): ئەمەش بریتییە لە بەش بەشکردن و شیکردنەوەی دەقی نووسراوی کوردی. ئەرکەکانی ناو شیکاری دەق لەوانەیە بریتی بن لە نیشانەدان (دابەشکردنی دەق بۆ وشە یان ڕستە)، تاگکردنی بەشێک لە قسەکردن (ناسینەوەی بەشە ڕێزمانییەکانی قسەکردن بۆ هەر وشەیەک)، و شیکاری مۆرفۆلۆژی (پشکنینی پێکهاتەی وشەکان).
ناسینەوەی قسەکردن(Speech Recognition): پەرەپێدانی سیستەمێک کە بتوانێت بە وردی زمانی کوردی قسەکراو بنووسێتەوە بۆ دەقی نووسراو، لایەنێکی بەرچاوی پرۆسێسی زمانە. ئەمە بە تایبەتی بۆ بەرنامەکانی وەک یاریدەدەری دەنگ و نەرمەکاڵای دیکتەکردن گرنگە.
وەرگێڕانی ئامێر(Machine Translation): دروستکردنی سیستەمێک کە بتوانێت بە شێوەیەکی ئۆتۆماتیکی دەق لە زمانی کوردییەوە وەربگێڕێت بۆ زمانەکانی تر و بە پێچەوانەشەوە. ئەمەش یارمەتیدەرە بۆ تێپەڕاندنی بەربەستەکانی زمان و ئاسانکاری پەیوەندی نێوان قسەکەرانی زمانە جیاوازەکان.
ناسینەوەی قەوارەی ناو 🙁 Named Entity Recognition) دەستنیشانکردن و پۆلێنکردنی قەوارەکانی وەک ناوی کەسەکان، شوێنەکان، ڕێکخراوەکان و بەروارەکان لەناو دەقی کوردیدا.
شیکاری هەست (Sentiment Analysis) : دیاریکردنی هەست یان تۆنی سۆزداری کە لە دەقی کوردیدا دەربڕدراوە، کە دەتوانێت سوودی هەبێت بۆ تێگەیشتن لە ڕای گشتی و کاردانەوەکانی )فیدباکەکانی( کڕیار و بەکارهێنانەکانی تر.
بنیاتنانی زمان(Language Generation) : بنیاتنانی سیستەمێک کە بتوانێت دەقی زمانی کوردیی یەکگرتوو و گونجاو لە چوارچێوەی کۆنتێکستدا دروست بکات. ئەمەش گرنگە بۆ بەرنامەکانی وەک چاتبۆت و دروستکردنی ناوەڕۆک.
بەڵام پەرەپێدانی ئامراز و تەکنەلۆژیای کاریگەر بۆ پرۆسێسکردنی زمانی کوردی، ڕووبەڕووی ئاستەنگ دەبنەوە کە پێویستیان بە هەوڵی لێکۆڵینەوە و پەرەپێدانی چڕ هەیە.
ئاستەنگەکان
پرۆسێسکردنی زمانی کوردی ڕووبەڕووی چەند ئاستەنگێک دەبنەوە، هاوشێوەی ئەو ئاستەنگانەی کە لە پرۆسێسکردنی زمانەکانی دیکە ڕووبەڕووی دەبنەوە. هەندێک لەو ئاستەنگە سەرەکی بریتین لە:
سنووردارکردنی سەرچاوەکان: زمانی کوردی ئەو سەرچاوە بەرفراوانەی زمانی نییە کە بۆ زمانە سەرەکییەکان، وەک ئینگلیزی یان ئیسپانی بەردەستە. ئەمەش کۆڕپۆرا سنووردارە تێبینیکراوەکان، فەرهەنگەکان و ئامرازەکانی تری پرۆسێسکردنی زمان لەخۆدەگرێت.
جیاوازی زاراوە: زمانی کوردی بە شێوەزاری جۆراوجۆر لە سەرانسەری ناوچە جیاوازەکاندا قسە دەکرێت و دەکرێت جیاوازییەکی بەرچاو لە نێوانیاندا هەبێت. پەرەپێدانی ئامرازەکانی پرۆسێسی زمان کە بتوانن مامەڵە لەگەڵ ئەم گۆڕانکاریانەدا بکەن، ئاستەنگە.
پرسەکانی ستانداردکردن: نەبوونی فۆرمێکی ستانداردکراوی زمانی کوردی دەتوانێت ئەرکەکانی پرۆسێسکردنی زمانی سروشتی ئاڵۆز بکات. هەوڵەکان بۆ ستانداردکردنی زمانی کوردی بەردەوامن، بەڵام هێشتا پرۆسەکە بە ئەنجام نەگەشتووە.
نەبوونی ئامرازەکانی: NLP بە بەراورد لەگەڵ زمانە بەربڵاوەکان، زمانی کوردی کەمتر ئامراز و کتێبخانەی پرۆسێسی زمانی سروشتی (NLP)ی هەیە. ئەمەش وا دەکات پەرەپێدانی بەرنامە و تەکنەلۆژیاکان کە پشت بە پرۆسێسی پێشکەوتووی زمان دەبەستن، سەخت بێت.
لێکۆڵینەوەی سنووردار: تاڕادەیەک کەم لە لێکۆڵینەوە و پەرەپێدان هەیە کە لەسەر پرۆسێسی زمانی کوردی بە بەراورد لەگەڵ زمانە سەرەکییەکان. ئەم گرنگینەدانەش پێشکەوتنەکان لە پەرەپێدانی تەکنەلۆژیای زمانی ئاڵۆز بۆ زمانی کوردی بەربەست دەکات.
پەرەسەندنی زمان: زمانی کوردی وەک هەر زمانێکی زیندوو بە تێپەڕبوونی کات گۆڕانکاری بەسەردا دێت. مانەوە لە نوێکاری لەگەڵ ئەم گۆڕانکاریانە و گونجاندنی مۆدێلەکانی پرۆسێسی زمان بەپێی ئەوان ئاستەنگێکی بەردەوامە.
پاڵپشتی لە تەکنەلۆجیای هەنووکەدا: ڕەنگە زۆرێک لە بەرهەم و خزمەتگوزارییە تەکنەلۆژییە سەرەکییەکان بە تەواوی پشتگیری زمانی کوردی نەکەن. ئەمە دەتوانێت سنووردارکردن لە سیستەمی ناسینەوەی دەنگ، وەرگێڕانی ئامێر و بەرنامەکانی تری بنەمادار بە زمان لەخۆبگرێت.
چارەسەرەکان
باشترکردنی پرۆسێسکردنی زمانی کوردی بریتییە لە تێکەڵەیەک لە هەوڵی زمانەوانی، تەکنەلۆژی و کۆمەڵایەتی. لێرەدا چەند چارەسەرێکی ئەگەری دەخەینەڕوو:
پەرەپێدانی سەرچاوەی زمانەوانی:
کۆرپۆرا: دروستکردنی کۆڕپۆرای گەورە و تێبینیکراو بۆ زمانی کوردی لە سەرانسەری زاراوە جۆراوجۆرەکاندا. ئەمەش داتای دەقی دەگرێتەوە کە بە دەست بۆ ئەرکەکانی وەک تاگکردنی بەشێک لە قسەکردن، ناسینەوەی یەکە ناودارەکان و شیکاری هەستەکان ناوزەد کراون.
سەرچاوەی وشەسازی: پەرەپێدانی فەرهەنگ و بنکەدراوەی وشەیی گشتگیر بۆ زمانی کوردی، حسابکردن بۆ گۆڕانکارییەکانی زاراوە و پەرەسەندنی بەکارهێنانی زمان.
ستانداردکردن: هاندان و پاڵپشتیکردنی هەوڵەکان بۆ ستانداردکردنی زمانی کوردی. دامەزراندنی فۆرمێکی ستانداردکراوی زمانی کوردی دەتوانێت یارمەتیدەر بێت لە پەرەپێدانی ئامرازە یەکگرتووەکانی پرۆسێسکردنی زمان.
توێژینەوەی هاوبەش :پەرەپێدانی هاوکاری لە نێوان زمانناسان و توێژەران و گەشەپێدەرانی تایبەتمەند لە پرۆسێسکردنی زمانی کوردیدا. پێشخستنی پڕۆژەی نێوان زانستەکان کە باس لە ئاستەنگە زمانەوانییەکان دەکەن و بەشداری دەکەن لە پەرەپێدانی ئامرازەکانی. NLP
وەرگێڕانی ئامێر :وەبەرهێنان لە سیستەمی وەرگێڕانی ئامێری تایبەت بە زمانی کوردی، کە وەرگێڕانی ورد لە نێوان زمانی کوردی و زمانەکانی تردا کارا دەکات. ئەمەش دەتوانێت پەیوەندی و ئاڵوگۆڕی زانیاری بەرز بکاتەوە.
ناسینەوەی زمانی: پەرەپێدانی سیستەمی بەهێزی ناسینەوەی قسەکردن بۆ زمانی کوردی، بە لەبەرچاوگرتنی شێوەزار و لەهجەی جۆراوجۆری کوردی. ئەمە بۆ بەرنامەکانی وەک یاریدەدەری دەنگ و خزمەتگوزارییەکانی نووسینەوە زۆر گرنگە.
کارلێککردنی کۆمەڵایەتی: کۆمەڵگەی کوردی لە دەستپێشخەرییەکانی پرۆسێسی زماندا بەشدار بکەن. هاندانی بەشداری بەکارهێنەر، فیدباک و بەشداریکردن لە پەرەپێدانی سەرچاوە و ئامرازەکانی زماندا.
گونجاندنی ئامرازەکانی NLP ی ئێستا: دەستکاریکردن و گونجاندنی ئامراز و مۆدێلەکانی NLPی هەنووکەیی بۆ ئەوەی باشتر لەگەڵ تایبەتمەندییەکانی زمانی کوردیدا بگونجێت. دەتوانرێت تەکنیکەکانی فێربوونی گواستنەوە بەکاربهێنرێت بۆ بەکارهێنانی ئەو زانیاریانەی کە لە پرۆسێسکردنی زمانەکانی تردا بەدەست هاتوون.
دەستپێشخەرییە پەروەردەییەکان :پەرەپێدانی پەروەردە و هۆشیاری سەبارەت بە پرۆسێسی زمانی کوردی لە نێو خوێندکاران، توێژەران، و گەشەپێدەران. هاندان بۆ بەشداریکردن لە خولی NLPو هاوشێوەکانی کە گرنگی بە زمانی کوردی دەدەن.
پڕۆژەکانی سەرچاوە کراوە: پشتگیری و بەشداریکردن لە پڕۆژە سەرچاوە کراوەکانی (open-source) پەیوەست بە پرۆسێسکردنی زمانی کوردی. هاوکاری لەناو کۆمەڵگەی سەرچاوە کراوەدا دەتوانێت پەرەپێدانی ئامراز و سەرچاوەکان خێراتر بکات.
پشتگیری حکومەت :هاندانی پشتیوانی حکومەت بۆ دەستپێشخەرییەکانی پەیوەست بە پرۆسێسکردنی زمانی کوردی. هاوکاری مادی و پشتگیری دامەزراوەیی دەتوانێت ئاسانکاری بۆ هەوڵەکانی توێژینەوە و پەرەپێدان بکات.
بە تێکەڵکردنی ئەم چارەسەرانە، لایەنە پەیوەندیدارەکان دەتوانن کار بکەن بۆ دروستکردنی ژێرخانێکی بەهێز بۆ پرۆسێسکردنی زمانی کوردی، دڵنیابوون لەوەی کە پێشکەوتنە تەکنەلۆژییەکان زمانەکانی کەمتر قسەپێکراو وەک زمانی کوردی لەخۆدەگرێت. هاوکاری، بەشداریکردنی کۆمەڵگا و لێکۆڵینەوە بەردەوامەکان پێکهاتەی سەرەکین بۆ تێپەڕاندنی ئەو ئاستەنگانەی کە ڕووبەڕووی رۆسێسی زمانی کوردی دەبنەوە.
سەرچاوەکان:
Veisi, H., MohammadAmini, M. and Hosseini, H., 2020. Toward Kurdish language processing: Experiments in collecting and processing the AsoSoft text corpus. Digital Scholarship in the Humanities, 35(1), pp.176-193.
Ahmadi, S. and Masoud, M., 2020. Towards machine translation for the Kurdish language. arXiv preprint arXiv:2010.06041.
Ahmadi, S., A tokenization System for the Kurdish Language, 2020.
Jacksi, K. and Ali, I., 2023. The Kurdish Language corpus: state of the art. Science Journal of University of Zakho, 11(1), pp.127-133.
Esmaili, K.S., 2012. Challenges in Kurdish text processing. arXiv preprint arXiv:1212.0074.
Ahmadi, S., 2020, November. KLPT–Kurdish language processing toolkit. In Proceedings of second workshop for NLP open source software (NLP-OSS) (pp. 72-84).
Hassani, H., 2018. BLARK for multi-dialect languages: towards the Kurdish BLARK. Language Resources and Evaluation, 52(2), pp.625-644.

